hadoop面试题(自己整理版)

1、 hadoop 运行原理
2、 mapreduce 原理
3、 mapreduce 的优化
4、举一个简单的例子说下 mapreduce 是怎么运行的
5、 hadoop 中 combiner 的作用
6、简述 hadoop 的安装
7、请列出 hadoop 的进程名
8、简述 hadoop 的调度器
9、列出你开发 mapreduce 的语言
10、我们开发 job 时是否可以去掉 reduce 阶段
11、 datanode 在什么情况下不会备份
12、 combiner 出现在哪个过程
13、 hdfs 的体系结构
14、 3 个 datanode 中有一个 datanode 出现错误会怎么样
15、描述一下 hadoop 中，有哪些地方用了缓存机制，作用分别是
什么？
16、如何确定 hadoop 集群的健康状况
17、 shuffe 阶段，你怎么理解
18、 mapreduce 的 map 数量和 reduce 数量怎么确定，怎么配置
19、简单说一下 mapreduce 的编程模型
20、 hadoop 的 TextInputFormatter 作用是什么，如何自定义实现
21、 hadoop 和 spark 都是并行计算，他们有什么相同和区别
22、为什么要用 flume 导入 hdfs， hdfs 的架构是怎样的
23、简单说一下 hadoop 和 spark 的 shuffle 过程
24、 hadoop 高并发
25、 map-reduce 程序运行的时候会有什么比较常见的问题

posted @ 2018-07-16 14:52 stone1234567890 阅读(2931) 评论(4) 收藏举报

刷新页面返回顶部

大数据开发程序猿

做有态度的码农，欢迎各位朋友光临，本博客长期更新，需要学习讨论找工作面试的同学可以加qq群：694117549，交个朋友相互交流。

hadoop面试题(自己整理版)

公告